#плохое поведение AI18.06.2025
OpenAI показала, как обнаружить и исправить «плохое поведение» AI-моделей
OpenAI выявила, как AI-модели могут развивать вредоносное поведение после обучения на плохих данных, и показала эффективные способы обнаружения и исправления таких проблем для повышения безопасности.